Sparticle(東京都中央区)は2026年2月3日、デスクトップサイズのAIサーバー「NVIDIA Spark」にオンプレミス特化型生成AIパッケージ「GBase」を導入し、社内ネットワーク内でAIエージェント基盤を構築する「GBase on Spark」を紹介した。従来GPUサーバーと比べ、同等のLLM推論環境のハードウェアコストを約1/20まで抑えられる可能性があるという。
対象は、金融・公共・製造など機密情報をクラウドに出せない組織の情報システム部門など。LLM(大規模言語モデル)やVLM(画像も扱えるモデル)を内蔵し、社内文書を検索して回答するRAG(検索拡張生成)を高精度化するほか、アクセス制御・権限管理・操作ログ記録で内部統制にも対応するとしている。
実装は、SparkにGBaseをインストールし、量子化処理とARM最適化でLLM/VLMを動かす。1台で数十人の同時接続を想定し、32kコンテキストでTTFT(最初のトークンが出るまでの時間)10秒以内を掲げる。長文は128K+に対応し、例としてOpenAI OSS-GPT-120B(総パラメータ117B、コンテキスト128K)やQwen3-Next-80B(総80B、コンテキスト256K)を挙げた。PoCは2週間、本番稼働まで1カ月が目安だという。
今後は、音声からの議事録生成と要点・アクション抽出、検索までを含む会議記録自動化や、FAQ・定型回答、提案書テンプレートなど文書自動生成の用途拡大を見込む。
【商品情報】
公式サイト: https://onspark.gbase.ai
お問い合わせフォーム: https://news.sparticle.com/contact
企業URL: https://www.sparticle.com
